AI资讯新闻榜单内容搜索-DeepSeek

扒完 DeepSeek V4 报告，我翻出了这个隐藏彩蛋

今天上午，DeepSeek V4 发布，直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候，在训练层面看到了一个被大部分人滑过去的名词：Muon 优化器。

来自主题: AI技术研报

9114 点击 2026-04-25 10:12

DeepSeek V4 发布，全网最细解读 & 技术报告拆解

Agentic Coding 评测里 V4-Pro 已经到当前开源最佳水平。DeepSeek 公司内部已经把 V4 作为默认编码模型，反馈是优于 Sonnet 4.5，交付质量接近 Opus 4.6 的非思考模式，和 Opus 4.6 的思考模式还有差距。这次还专门为 Claude Code、OpenClaw、OpenCode、CodeBuddy

来自主题: AI技术研报

10776 点击 2026-04-24 16:28

智源：FlagOS完成DeepSeekV4八款芯片Day0 适配，实现三重技术突破

由智源研究院牵头研发的众智 FlagOS 第一时间对两个“巨无霸”模型进行全量适配，已经完成 DeepSeek-V4-Flash 在8款以上 AI 芯片上的全量适配与推理部署，包括海光、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数、英伟达（FP8）等芯片。FlagOS 同时正在推进 DeepSeek-V4-Pro 模型在多个芯片的迁移适配，晚些时间开源出来，敬请期待。

来自主题: AI资讯

8851 点击 2026-04-24 16:23

刚刚，DeepSeek开始频繁更新：Tile Kernels、DeepEP V2

就在刚刚，DeepSeek 的 GitHub 开始了频繁更新，上线开源了一个新的代码库 Tile Kernels，同时并对 DeepEP 代码库进行了更新，上线了 DeepEP V2。距离上次 DeepSeek 悄悄更新 Mega MoE、FP4 Indexer 还不到一周。

来自主题: AI资讯

9293 点击 2026-04-24 10:09

独家｜DeepSeek 50亿起投，最新估值高达3000亿

一位接近DeepSeek的一线机构投资人士告诉我们，这些数字都不准确，DeepSeek融前估值是3000亿人民币，约合440亿美元。这一估值超过当前已经上市的大模型公司Minimax的2400亿（4月23日），接近智谱的3800亿元。

来自主题: AI资讯

9111 点击 2026-04-23 17:09

DeepSeek V4发布前，罗福莉亮剑！小米最强大模型MiMo-V2.5深夜突袭

小米大模型时隔一月能力飙涨，比Kimi K2.6省42% Token。

来自主题: AI资讯

6492 点击 2026-04-23 10:55

请来 DeepSeek 核心成员阮翀，元戎启行要打的是另一场仗

大模型人才涌入，帮助智驾厂商突破原有技术框架上限。

来自主题: AI资讯

8270 点击 2026-04-22 16:37

英伟达良心福利！免费领一年顶级大模型订阅

英伟达良心福利！免费领一年顶级大模型订阅，MiniMax / Kimi / DeepSeek 全都能用！NVIDIA 官方平台build.nvidia.com开放了一批"Free Endpoint"模型，注册账号、验证手机号后就能生成一把最长有效期12 个月的 API Key，免费调用几十个当下最火的大模型——不计 Token、无余额限制、无需信用卡。

来自主题: AI资讯

10778 点击 2026-04-21 09:17

世界引擎：Post-Training开启Physical AGI新纪元

一年前，DeepSeek R1 横空出世，人们才意识到，真正让模型产生推理能力质变的，不必是更大的预训练规模 —— 后训练，用强化学习、过程奖励、闭环反馈，以极低的代价解锁了原本需要数倍算力才能触达的能力边界。

来自主题: AI技术研报

6826 点击 2026-04-20 09:00

Claude最强模型没那么神话，DeepSeek R1也能找到「大 bug」

上周 Anthropic 发布 Mythos Preview 的时候，安全圈的反应可以用一个词概括：震惊。

来自主题: AI资讯

10154 点击 2026-04-16 11:17